#Manus AI
Fortune雜誌─美國科技巨頭為何押注一家中國神秘公司?
今日,Meta宣佈完成對通用自主AI智能體公司Manus(蝴蝶效應)的收購。根據公開資訊,這筆交易金額達數十億美元,也成為Meta成立以來規模第三大的收購案,僅次於收購WhatsApp以及此前對Scale AI的戰略性投資。圖片來源:視覺中國Meta收購Manus的消息出現得很突然。Manus產品去年9月剛剛上線,關於本次收購,似乎也沒有經歷長時間的拉扯。有投資人回憶,談判周期極短。對一家規模龐大、內部流程嚴密的公司而言,這種速度本身就值得注意:它更像一次基於窗口期的決策。更關鍵的是,Meta買下的並不是一家訓練大模型的公司。Manus不以底層模型為核心資產,它的價值更接近一種應用層能力:把現有模型與工具組織起來,形成可以持續完成任務的產品形態。對一家以平台分發和使用者規模見長的公司來說,這樣的併購更像一次戰略補位,而非簡單的功能補充。理解這筆交易,首先需要理解Manus到底在做什麼。與大多數對話式AI產品不同,Manus並不是試圖讓系統“更會聊天”,而是讓它成為一個能交付結果的智能體。在常見的使用場景中,使用者仍停留在“問—答—修訂—再問”的循環裡,而 Manus試圖把互動向前推進一步:使用者只需給出目標,例如完成一份行業研究、整理競品資訊、生成結構化備忘錄,系統會自行拆解任務、呼叫工具、校驗輸出,並在過程中不斷調整計畫。這類產品的難點,並不在於第一次能否給出正確答案,而在於出錯之後能否繼續向前推進。因此,Manus的設計重點更多放在工程與流程上:任務狀態需要被保存,中斷後可以恢復,目標變化時能夠重新計算,錯誤也能被使用者以較低成本糾正。對使用者而言,這意味著不必反覆從頭開始,而是像管理一名初級員工那樣,把事情一步步推向完成。Manus官方披露的營運資料,包括累計處理的token數量和虛擬計算環境規模——更像是一種側面說明:這套系統已經在真實世界的壓力下運行過,而不僅僅停留在演示階段。這種對“持續完成任務”的執念,並非從AI時代才開始形成。把時間線往前撥,壹伴這款用於提升微信公眾號編輯效率的瀏覽器外掛同樣出自這批人。壹伴解決的是排版、編輯、發佈效率等高度具體的問題,它的成功並不依賴宏大敘事,而在於“每天都有人用”。在商業產品中,這類工具型成功往往意味著團隊具備對真實工作流的理解,以及對細節體驗的長期打磨能力。壹伴之後,該團隊又推出了微伴,一款圍繞企業微信生態的工具,服務對象從內容編輯擴展到銷售和企業營運人員,開始處理更複雜的協作、流程和資料連續性問題。這一階段,產品從個人效率工具,演進為組織流程工具,目標也從“好用”轉向“可靠、可控、可複製”。從壹伴到微伴,再到Manus,表面上跨越了不同賽道,但核心高度一致:把重複、繁瑣、需要人持續盯著的事情,逐步交給系統穩定完成。這條路徑,也解釋了為什麼 Manus 會在產品設計中,把“任務持續性”放在如此核心的位置——它更像一家長期做工具的公司,在 AI 時代終於獲得了足夠成熟的技術條件。從團隊背景看,Manus具有明確的中國創業公司起源。創始人肖弘和早期合夥人來自中國本土高校,早期創業與試錯主要發生在中國網際網路環境中,產品方法論偏向務實、節制、貼近使用者。但在進入AI應用階段後,公司逐步將主體與核心營運轉向新加坡,並以新加坡為總部面向全球市場。今天,從法律和營運層面看,它更像一家總部位於新加坡的國際科技公司;從團隊基因和產品文化看,它仍然是一家中國創業者主導的公司。這種結構在當下並不罕見:既滿足國際化營運與合規的現實需求,也為進入全球平台生態預留空間。對潛在收購方而言,這意味著更低的整合摩擦。如果說Manus的價值在於“已經跑通了一種應用形態”,那麼Meta的動機則更像是對多重結構性壓力的回應。將這筆併購簡單理解為“巨頭害怕落後”並不精準。更現實的情況是,AI技術的演進正在壓縮產品窗口期。一旦模型能力跨過可用閾值,使用者預期會迅速從“會回答”轉向“能完成”,競爭重心隨之從模型本身下移到產品化與交付效率。對Meta來說,內部孵化並非不可行,但周期更長、跨部門協同成本更高。併購的意義,並不是買到獨家技術,而是獲得一套已經在真實使用者中跑通的產品範式,從而節省數年的試錯時間。與此同時,入口形態也在發生變化。Meta長期的優勢在於分發,但AI時代的新入口未必表現為某個功能按鈕,而更可能是一種新的互動方式,即使用者把任務交給系統,在後台完成。如果AI Agent成為下一代工作與生活的默認入口,平台價值將被重新分配,Meta顯然不願在這一階段只充當流量提供者。組織層面的壓力同樣存在。當AI從研究走向產品,挑戰往往不在單點技術,而在端到端協同:模型、產品、工程、商業化、合規和安全需要同時推進。大型組織在這一階段反而容易被自身複雜性拖慢,而Manus這樣的團隊,已經在真實使用者中完成了一輪端到端交付的磨合,這類經驗很難通過內部指令快速複製。競爭敘事的變化,也在強化這種緊迫感。Google推出Gemini 3,更像一枚訊號彈:模型能力正在穩定提升並逐步可用,差異優勢正從“更強模型”下沉到“更快把能力變成結果”。交易體量進一步說明了Meta的判斷。Meta收購WhatsApp和ScaleAI幫助這家巨頭在移動網際網路時代完成了使用者結構躍遷,後者被視為其在AI基礎設施和資料能力上的關鍵補位。與這兩筆交易相比,Manus的特殊之處在於,它既不直接對應使用者規模擴張,也不直接對應底層技術突破,而位於兩者之間——應用層的執行與交付能力。這在某種程度上意味著,Meta此次併購的核心考量並非買下已經確定的回報,而是為正在形成的入口形態提前鎖定位置。這是一筆典型的“用時間定價”的交易:資本所購買的,是縮短學習曲線和產品落地周期的能力。併購完成後仍強調獨立營運,也並非姿態。對Meta來說,Manus最關鍵的資產不是程式碼,而是其產品節奏與工程習慣。一旦完全納入大公司流程,這種節奏反而最容易被稀釋。從壹伴算起,Manus團隊做工具已經接近十年。這些產品很少成為行業話題中心,卻反覆出現在使用者真實的工作流程中。它們的共同特徵並不複雜:穩定、可預期、能夠在出錯後繼續向前推進。AI的出現,並沒有改變這家公司想解決的問題,只是讓這些問題第一次有了更合適的技術條件。對Meta而言,這筆併購也不必被解讀為一次激進下注。在模型能力趨同、窗口期縮短的階段,用資本換取確定性,是一種典型的大公司策略。接下來真正值得觀察的,並不是Meta是否能把 Manus 整合進自身產品線,而是這種以“交付結果”為中心的產品節奏,能否在更大的平台體系和更複雜的組織結構中被長期保留下來。這也將決定Manus最終被記住的方式:是一次突然的併購,也是Meta在人工智慧時代重新理解“入口”的起點。 (財富FORTUNE)
深網獨家 | Manus被Meta數十億美元收購背後:創始人肖弘復盤至暗時刻
12月30日,Meta宣佈完成一筆重量級併購,以數十億美元的價格收購AI Agent產品Manus背後的公司“蝴蝶效應”。這是Meta成立以來金額排名第三的收購,僅次於WhatsApp和Instagram。交易完成後,蝴蝶效應將保持獨立營運,其創始人、騰訊青騰校友肖弘將出任Meta副總裁。這筆交易的推進異常迅速。多位接近交易的人士透露,從雙方正式接觸到最終達成協議,整個談判周期僅十餘天。據悉,在收購發生前,蝴蝶效應正以約20億美元的估值推進新一輪融資。Meta對Manus的興趣並非偶然。祖克柏及多位Meta核心高管均為Manus的長期使用者。在Meta近期重組AI研究體系、高薪引入頂尖研究人員,並持續加大算力投入的背景下,這筆收購被視為其推進“超級智能”戰略的關鍵一步。蝴蝶效應成立於2021年,早期以瀏覽器AI外掛Monica切入市場,成為中國AI行業中少數實現盈利的應用產品。2024年3月,公司推出通用AI Agent產品Manus,能夠調度多種工具完成複雜任務,上線後迅速在國內外引發關注。其發展勢頭在2025年達到新的高峰:同年11月,Manus位列“全球最具潛力創業公司”榜單亞洲區第一。值得注意的是,其風靡全球的演示視訊,是團隊用借來的鏡頭、基礎的剪輯工具,在不到一周時間內趕製而成,體現了公司“在本質上重注,在形式上極簡”的極致效率文化。今年12月,公司宣佈年度經常性收入(ARR)突破1億美元,旋即迎來了Meta的收購邀約。對Meta而言,這並非一次單純的產品或團隊併入,而是一項圍繞AI應用形態的戰略佈局;而對這家源自中國的創業公司而言,Manus也由此被正式納入全球科技巨頭的核心體系之中。Meta超級智能實驗室(MSL)負責人Alexandr Wang(汪韜)轉發了相關消息,並配文稱,Manus團隊在探索當今大模型“能力過剩”問題上處於世界領先水平。此外,該實驗室正在新加坡擴展團隊,Manus原有約100名成員已加入其當地組織。獲得如此評價的Manus團隊,其發展路徑卻充滿非常規的選擇。過去兩年,肖弘主導了三次反共識決策:關乎“生死”,叫停研發七個月的AI瀏覽器項目,轉向為AI配獨立電腦;關乎“快慢”,在流量昂貴時堅持零市場預算,押注算力換體驗;關乎“組織”,推動80%程式碼由AI生成,探索“AI 時代公司形態”的未來。從連續創業者到Agent賽道領跑者,肖弘如何思考行業競爭與未來?近日,他與騰訊集團高級管理顧問、騰訊青騰教務長楊國安在《一問》欄目中展開深度對話,復盤Manus的取捨,並分享了他對AI時代產品邏輯及組織進化的思考。以下是對話整理,經精編如下:範式之變:當AI從“給答案”變成“給結果”楊國安:未來10年,AI對你所在行業最大的改變是什麼?肖弘:核心在於產品開發模式的重塑。軟體研發將更多由AI系統主導。在AI輔助下,我們能以更精銳的團隊,極大縮短開發周期。對生活的影響有兩點:一是產品迭代速度將快得超乎想像,衝擊各行各業;二是AI能力將普及化,每個人都需學會高效運用AI以實現自我提升。楊國安:你們相信“模型能力會外溢,應用是價值核心”,如何形成這個判斷?肖弘:這源於我們此前的連續觀察。做Monica(瀏覽器外掛)時,我們發現“上下文”是關鍵,於是讓外掛自動抓取網頁資訊,免去使用者複製貼上。後來Cursor火了,它證明當模型編碼能力成熟時,Chatbot並非最佳產品形態,需要一個更貼合編碼工作流的載體。這兩個案例讓我們意識到,技術能力一直在進化,但產品形態常常滯後。去年底,我們看到“Agent”這種能進行複雜規劃和自主執行的新能力出現,判斷它同樣缺乏好的產品化形態。這就是我們的機會:抓住模型能力外溢的窗口。楊國安:從給答案的Chatbot,到給結果的Agent,最本質的變化是什麼?肖弘:Chatbot給你一個答案,可能需要你再花兩小時把它變成結果。Agent則試圖直接交付那個結果。比如,做一個研究並生成精美的PPT,全程無需干預,只需幾分鐘。這帶來三個深遠變化:一是成本驟降,過去只有諮詢業能做的定製PPT,現在房產中介也能用AI生成;二是多樣性爆發,Agent可平行生成多個版本供你挑選;三是容錯性增強,任務失敗後它能自動反饋、重試,提高了完成率。楊國安:這會如何改變組織形態?肖弘:我們有一個更大膽的展望。一些用好了AI的大公司會變得更強大,但同時會出現大量微型個體。在AI的賦能下,一兩個人就能成就一項過去需要公司才能運作的事業。因為AI替他們省去了搭建組織、管理流程等複雜事務,直接交付結果。楊國安:我在“數智革新楊五環”的1.0版本研究集中在傳統行業的標準化、數位化、智能化,以實現降本增效和精準決策。但你剛才的觀點讓我很興奮——Agent能處理非標任務,這比標準化流程的潛力更大。若真實現,那些行業會受最大衝擊?肖弘:關鍵在於理解Agent是“思考+執行”。AI拓寬思考的廣度與深度,人則負責最終判斷與選擇。因此,衝擊將首先席捲高度數位化的“案頭工作”領域。給AI配一台“電腦”,而非“搶滑鼠”楊國安: Manus採用“大模型+雲端虛擬機器”的架構,核心優勢是什麼?肖弘:這是我們最關鍵的判斷之一。我們思考的終極問題是:AI的終極“外殼”是什麼?答案是:電腦。在數字世界裡,電腦是人類處理一切事務的終端。那麼,給AI配一台專屬電腦,它理論上就能像人一樣完成所有工作。虛擬機器的最大優勢,是能處理海量長尾任務。無論是安裝特定軟體,還是運行自己編寫的程式碼,AI都能在自己的虛擬環境裡完成。我記得第一次感到震撼,是看到Manus執行git clone命令,將開放原始碼專案下載到自己的“電腦”裡來解決問題——這像極了人類“使用工具”的行為。挑戰在於速度和資源消耗,但長期看這些問題會解決。而它能解決通用方案無法處理的長尾問題,這本身就構成了我們的護城河。楊國安:你們曾經投入七個月探索 AI 瀏覽器,但最終決定放棄。為什麼?肖弘:這確實是我們非常關鍵的一次戰略取捨。我們在2024年初立項做AI瀏覽器,在當時看來是一個非常順理成章的判斷。您可能知道,我們在Manus之前有一款產品叫Monica,它是一個瀏覽器外掛。當時我們想,既然我們在瀏覽器外掛上已經做得不錯了,為什麼不直接做一款瀏覽器呢?有了瀏覽器之後,一些任務就可以直接在瀏覽器內幫助使用者執行和完成。想到這個Idea 時,我們非常興奮,覺得它突破了瀏覽器外掛的天花板。我們大概花了六個多月時間去開發這款瀏覽器,從底層技術開始,我們自己編譯了開放原始碼的Chrome核心,然後將AI能力部署上去,讓它能夠在某些任務上實現自動化執行。但是,最終放棄的決定,是基於兩個核心原因:一個宏觀的戰略判斷;一個微觀的產品體驗問題。楊國安:那些改變公司命運的重大決策(如放棄瀏覽器、選擇全球化),背後的思考原則是什麼?肖弘:決策本身的邏輯很清晰:永遠從“技術能解決使用者的什麼根本問題”出發,再推導商業模式。真正的難度不在於分析,而在於有無勇氣堅持清晰的答案,並克服內部慣性,將其變為全組織的共識與行動。思考可能只需一個月,但落地執行往往更耗心力。楊國安:Agent技術落地的臨界點將取決於什麼?肖弘:我覺得可以從兩個層面來看。第一類,是您剛剛提到的核心基礎能力的提升。比如成本、速度、更長的上下文、以及在長上下文的指令遵循能力。這些都至關重要。成本和速度直接影響了產品是否能被更多使用者負擔和使用。指令遵循和上下文處理則影響了任務的完成率。這些能力我們一直在密切關注,一旦有新的突破,肯定會立即應用到產品化中。第二類,有一項能力是我個人比較期待的,它雖然已經被應用,但我預測在今年內或明年初會有比較大的突破,就是通用的電腦使用能力。這意味著AI自己能夠識別並掌握如何使用一個軟體。這項能力一旦突破,像Manus這種自帶虛擬機器的產品,就能夠完成更多專業軟體或特定行業軟體的應用。我們可以想像,未來你拿起手機,通過Manus就能讓它去完成一個本來需要在電腦上用行業專業軟體才能完成的事情。我認為這項能力即將實現突破。根據我們與研究員的觀察和交流,一旦突破,將解鎖更多的應用場景。楊國安:如果Agent能直接呼叫現有軟體,繞過人工操作,會帶來什麼變化?肖弘:最大的變化是“解放值守”。許多需要人坐在電腦前操作專業軟體的任務,未來可以由Agent自動完成。AI已能處理其中的基礎判斷。即使遇到關鍵節點,也可像手機安裝App時請求授權一樣,由人一鍵確認。這最終將徹底顛覆現有軟體的操作邏輯和人們的工作方式。用昂貴的算力換取增長楊國安:PC時代有“安迪-比爾定律”——硬體(英特爾)的提升總被軟體(微軟)消耗掉。這是否說明,價值是由“技術能力”和“應用能力”共同創造的?肖弘:是的,這正是我們的核心參照。“安迪-比爾定律”建立在摩爾定律之上,意味著算力增長必然催生更耗資源的應用。微軟當年就是依據對未來算力的預測來規劃Windows的。這直接啟發了我們的產品思路:在技術飛速進化的當下,我們是否可以暫時忽略成本與速度,只專注於打造極限質量的產品?我們跟蹤最前沿的模型,不計代價地追求最佳體驗。這與傳統網際網路平衡質量、速度、成本的思路截然不同,也是我們敢於將昂貴算力轉化為核心競爭力的原因。楊國安:你們堅持“產品驅動增長”,零市場預算,這種打法的持續性如何?肖弘:這個思考來源於我們做Monica時的觀察。我記得當時與一位企業家交流時,他提到今天AI產品的成本結構,以Monica為例:在2024年,約三分之一的成本是員工薪資,三分之一是Token(大模型呼叫)費用,另外三分之一是投放在網際網路廣告平台上的增長費用。那次對話對我的啟發很大。我就在想:如果我們做一款產品,持續有大量的成本投入到廣告平台,那麼我們的增長就很可能被網際網路巨頭廣告平台所定義。我記得當時的情況是,一旦我們快要盈利、有了好的利潤空間時,廣告平台就會立即漲價,這種模式幾乎是可計算的。這與消費品行業通過廣告平台獲取增長後面臨的問題是相似的。所以我當時思考:有什麼東西是今天很貴,但未來會很便宜的?以及有什麼東西是今天很便宜,但未來會越來越貴的?結論是:AI API(Token 成本)今天很貴,但從長期來看,受摩爾定律和底層技術發展的驅動,它一定會變得更便宜。網際網路使用者的價格卻在不斷上漲。在早期,使用者願意探索,但一旦產品與市場契合,現有玩家就會通過廣告平台來獲取使用者,推高整個行業的使用者獲取成本。基於這個判斷,我給團隊設定的目標是:我們能否做出一個讓使用者覺得非常厲害、願意主動告訴朋友的產品?在某種程度上,我們就將原本昂貴的Token成本轉化為我們的使用者獲取成本。隨著 Token成本越來越便宜,而使用者獲取成本越來越貴,這個模型就具備了長期可持續性。當時給團隊的目標是:創造出讓人感到驚豔、願意傳播的產品,並且做到零市場行銷預算。在Manus上線的前一周,我們開了一次內部會議,正式確定必須是零市場預算。所以,今年年初大家看到Manus在社交媒體上火爆,是因為我們在某種程度上打造出了使用者預期的產品。像一些意見領袖之所以轉發,正是因為它確實擁有令人震驚的體驗,實現了大家對未來 AI 產品的設想。楊國安:為何首選服務C端“獨狼型”使用者,而非B端?肖弘:底層判斷是技術階段匹配。AI Agent技術仍處早期,迭代極快。大企業需要確定性和穩定性,而個體用戶、自由職業者更能容忍變化、擁抱創新。在技術快速變化的早期,最大化發揮迭代速度優勢的,正是C端市場。楊國安:Manus的生存戰略是與巨頭合作共生。許多巨頭包括Anthropic、OpenAI、Google等,已經有可能會推出自己的Agent。那麼,你們如何在這些巨頭中找到合作共生的機會呢?肖弘:我們的策略是合作共生,扮演“最佳體驗整合者”。底層模型競爭激烈,沒有一家能持續壟斷所有能力。Manus作為應用層,可以靈活整合各家最優模型,理論上能為使用者提供比任何單一家都更極致的體驗。這類似手機廠商與晶片廠商的關係:我們雖不造晶片(模型),但憑藉對使用者需求的深度理解和巨大用量,能反推模型最佳化,形成共贏。楊國安:如何讓Manus突破早期使用者,被普通大眾廣泛接受?肖弘:關鍵在於兩點:一是產品體驗的絕對差異化。在ChatGPT已成習慣的海外市場,我們必須讓使用者一眼感知到不同。比如,Manus不僅給答案,還會主動生成一個可互動的網頁,讓“Agent給結果”變得可視、可感。二是進行“場景化”的市場傳播。我們正跳出AI圈,與各垂直行業的博主合作,讓他們基於自身真實需求使用Manus,並向其受眾展示具體的使用場景,用他們熟悉的語言來定義Manus的價值。當“一個人成為一家公司”楊國安:當AI全面重構工作流,組織的核心任務似乎正在發生轉變。從你們的實踐看,這是否意味著傳統以管控和協作為主的模式需要被重新定義?你們強調“增強”並借此做出顛覆性決策,這套新模式的底層邏輯是什麼?肖弘:我們的實踐正是對這三個問題的同步回答。首先在組織上,我們正回歸一種更緊密的協作形態。即便公司規模擴大,我們幾位核心合夥人最近又重新坐在一個小房間裡工作,並設立每天固定的“無會議時段”專注討論產品。這背後的啟示是:當AI極大提升個體效率後,組織最核心的任務不再是管控流程,而是保障最關鍵的決策單元能進行高強度、高質量的思考與共識形成。其次,這也正是“增強”而非“替代”的落地體現。AI負責執行與拓寬思路,而人不可或缺的價值在於最終判斷、對齊預期與把握場景。組織創造這樣的深度溝通空間,就是為了強化“人”在戰略與審美上的最終決策權。最後,那些顛覆性決策正源於此。無論是砍掉項目還是All in新方向,邏輯都始於“技術能解決用戶的什麼根本問題”。真正的挑戰從來不是分析,而是在答案明確後,有無勇氣打破內部共識與路徑依賴,並將新共識堅決地付諸實踐。高頻、高質量的面對面碰撞,正是我們凝聚這種戰略勇氣、確保共識堅固的關鍵熔爐。楊國安:你認為100分的“AI原生組織”是怎樣的?肖弘:我們給自己打60分,因為很多工作慣性仍沿用舊方式。100分的組織,是AI深度融入每一個工作環節,成為員工的“第一反應”。就像遇到問題先Google一樣,未來員工會本能地先問AI。在新增任務上,我們會優先問:“這個能不能直接交給AI做?” 這才是真正的AI原生工作流。楊國安:我知道你在招聘時,也在努力識別那些真正具備AI原生思維的人才。你是如何識別這些人的?肖弘:我的方法是看他如何實際使用AI。我會請對方展示日常使用AI的痕跡。真正的AI原生者,使用量會遠超常人,AI已深度嵌入其工作流。“There’s No Software”的激進實踐:用AI吞食舊世界楊國安:你曾經提到過“There's No Software”的觀點。你認為Agent的發展將對軟體產業帶來那些影響?肖弘:根據我的觀察,這種影響已經開始形成,主要分為兩大部分。第一部分,是對軟體工程師和技術人員的影響。像Cursor或是Claude Code這樣的產品,已經讓軟體工程師的工作方式發生巨大變化。以我們公司為例,Manus主要的幾位工程師基本上不再親自手寫程式碼。我觀察他們的工作狀態,他們會打開多個Coding Agent窗口,像在與人聊天一樣進行協作。統計發現,我們公司接近80%的程式碼都是由AI生成的。工程師現在做的更多是梳理業務需求、審查程式碼質量、以及架構設計等工作。所以對軟體工程師來說,這種變革是正在發生且會更加徹底。我很難想像幾年後軟體開發會是什麼樣子,或許真的會像科幻片裡那樣,通過自然語言描述就能快速生成一個優秀的產品。第二部分,是對非技術崗位和組織內部IT系統的影響。很多組織內部的非工程師崗位也需要資訊系統支援。過去他們需要搭建內部IT團隊或尋求外部外包服務。我的觀察是,未來這種內部系統或非工程師崗位的資訊系統需求,一定能直接通過 AI Agent來完成。這種變革是巨大的:迭代周期會比外包更短,需求的個性化程度更高,你告訴Agent需求,它能立刻給你實現。這種變化在今天被低估了。Manus在這方面也有投入,我們近期會發佈相關產品。楊國安:AI將如何改變未來的SaaS行業?肖弘:我們的觀察和分析是,也許會分化為兩條路徑:對於存量SaaS,關鍵在於能否成功進行AI化改造。有頂級併購基金判斷,約一半的現有SaaS公司可能無法完成這一轉型。對於新增市場,創業者不必複製舊模式,而應基於已驗證的客戶需求,用AI原生的思維重新建構產品,這將是更大的機會。楊國安:隨著AI Agent有越來越強大的自主性,未來員工人數可能會減少。你是怎麼思考這種技術進步對行業帶來的社會影響?你在產品或技術上有沒有考慮倫理、安全等邊界問題?肖弘:這是一個必須長期思考的問題。一次測試中,Manus為查詢火車時間,在發現官網因罷工無資料後,竟試圖尋找聯絡方式、起草詢問郵件。這讓我們既震撼又警惕。但最後它沒成功,因為它沒有信箱,但它甚至準備去註冊一個信箱。那一刻,我覺得既驚訝又有些害怕。我們的原則是:一是利用好模型廠商已有的安全護欄;二是在關鍵節點設定使用者確認機制,防止AI“過度代表”使用者。作為創業者,我們的責任是釋放技術潛力,同時對其深遠影響保持敬畏與審慎。 (深網騰訊新聞)
Manus AI 上線以來最大更新:100 個 Agent 為你打工,但缺點是太燒錢了
一個 Agent(智能體)不夠用?Manus 乾脆給你拉來 100 個。今天凌晨,Manus 推出了一項新功能:Manus Wide Research。這項功能的核心亮點在於,使用者只需一鍵即可開啟大規模平行 Agent 協作,輕鬆處理原本需要耗費數小時、動用數百個資料來源的複雜調研任務。簡單來說,這類似於此前 Grok 4 Heavy 的多 Agent 模式——同時啟動多個 Agent 平行工作,最後整合輸出結果。不過,Manus Wide Research 的調度規模更為龐大,Agent 之間的協作也更加緊密。在官方的演示 demo 中,Mamus 展示了兩個典型的案例。第一個案例,是讓 Wide Research 對比分析 100 款運動鞋。從功能、定價、設計到銷量,Manus 會首先並行呼叫 100 個子 Agent ,每個負責一款產品,獨立抓取分析、彙總資訊。隨後,這批結果被自動彙總成 Excel 表格和網頁,交付清晰的最終排序和評估建議。第二個案例,是為即將舉辦的活動尋找海報靈感。Wide Research 能夠同時探索 50 種視覺風格,並自動生成匹配風格的完整海報圖樣。幾分鐘內,成品設計就能交到使用者手上。目前,這項新功能已率先向 Pro 使用者(199 美元/月)開放,並計畫逐步向 Plus(39 美元/月)和 Basic(19 美元/月)層級使用者開放。值得一提的是,系統會根據任務需求自動啟動 Wide Research,無需使用者手動設定或切換。X 網友 @LamarDealMaker 在體驗後發文稱:「manus wide research 是我最近用過的最好的工具之一。50 個 Agent 同時在網際網路上搜尋,收集 AI 新聞資料並填寫這張表格,現在我擁有了一個按需呼叫的個人 AI 蜂群,很興奮將其應用到我的日常工作流程中。」當然,Manus 的積分機制早就被吐槽「貴得離譜」,如今新功能大幅升級,積分的消耗速度勢必進一步飆升。Manus 聯合創始人肖宏也疑似在社交媒體上回應這個問題:AI 在開始時更像邊際成本很高的原子生意,然後(也許會)逐步轉變成為邊際成本更低或者接近於零的位元生意。和這個匹配的做法是1.製造超貴但是拓展人類能力邊界的 AI 產品。2.用 1 掙到的錢造價格實惠的 AI 產品。3.再用 2 掙到的錢造價格更實惠的 AI 產品。現在在階段 1,也才剛剛開始。下一個發佈,再來 100x Token 消耗量。就目前來看, Wide Research 的底層邏輯遠不止「多開 Agent」那麼簡單。其背後其實是一個系統級的平行計算機制——每個 Manus 會話都運行在一台獨立虛擬機器上,具備編排複雜雲工作負載的能力。而 Wide Research 把這套資源能力擴展到了百倍規模,試圖讓一個人調度一個 AI 雲端運算叢集。更重要的是,與傳統多 Agent 系統通過角色預設(比如設計師、程式設計師、分析師)進行分工不同,Wide Research 中的每個子 Agent 都是一個完整的 Manus 實例,能自主思考、自我執行,再集中交付任務結果。Manus 聯合創始人季逸超也在 X 平台發文,進一步解釋了這一架構的靈感來源:Wide Research 是我們在 Agent-Agent 協作方面的最新探索。基於我們的大規模虛擬化基礎設施,Manus 現在可以自主調度一支由同質 Manus Agent 組成的團隊平行工作,並彙總結果。在建構 AI Agent 的過程中,我們一直受到經典系統研究的啟發。Wide Research 直接受到了 20 多年前由 @JeffDean 和 Sanjay Ghemawat 提出的 MapReduce 範式的啟發。作為大規模分佈式系統的先驅,Google遇到了其他人尚未面臨的挑戰,並慷慨地與世界分享了他們的解決方案。如今,隨著 Manus 推動 AI Agent 的邊界,我們正遇到一類只有在大規模時才會出現的新問題。我們將繼續分享在此過程中學到的經驗。特別需要指出的是,儘管願景很宏大,Manus 並未提供足夠證據證明這種同時啟動數十甚至上百個子 Agent 的方案,是否真的比單個高容量 Agent 按順序完成任務更高效。子 Agent 如何分工、如何合併結果、在響應速度、精準率和成本上是否具備顯著優勢,官方尚未提供相關依據。 (APPSO)
一文讀懂ChatGPT Agent:沒超越Manus的能力範疇,但看到了端到端的曙光
Agent是今年AI圈最大的共識,OpenAI自然也無法落後。台北時間2025年7月18日凌晨1點,Sam Altman和四位OpenAI 的研究員在直播中正式發布了ChatGPT Agent——一款通用型AIAgent。前有Manus、Lovart和Flowith,ChatGPT Agent所呈現的功能場景並不算特別驚艷,但它發布的意義,要超越其功能本身。ChatGPT Agent的革命性在於其獨特的技術路徑:它可以主動從工具箱中選擇代理技能,使用自己的電腦完成任務,使用者可以即時觀察AI在虛擬環境中的工作過程。這種交互界面雖與Manus等產品相似,但底層原理卻有著本質差異。Manus調用多個底層模型,類似於“外部縫合”,而ChatGPT Agent,是將Agent能力內化於模型,我們已經看到了端對端通用Agent的雛形。Manus的設計實質上是透過調用多個底層模型來實現"外部縫合"。相較之下,ChatGPT Agent是將Agent能力內化於模型本身。根據OpenAI介紹,為了開發ChatGPT Agent,他們將Operator和Deep Research團隊合併為一個統一的團隊,這個新團隊由20至35人組成。根據ChatGPT Agent的系統卡顯示,它是一個新的代理模型,與OpenAI o3同屬一個系列,採用了端到端的訓練方法。它是為代理任務開發的統一模型,而不是多個模型的工程化組合。根據OpenAI放出的對比PPT,我們可以看到,這項訓練基本上是透過強化學習過程完成的。和Grok4withtool的路徑應該差不多。經過再訓練,Agent結合了Deep research的多步驟研究和高品質報告產生能力、Operator透過遠端視覺化瀏覽器環境執行任務的能力、具有有限網路存取權限的終端工具,以及透過連接器存取外部資料來源和應用程式的能力。在執行完複雜任務之後,也可以交付給使用者一個可下載的一個PPT或一份文件。對Manus而言,OpenAI的這項新舉措無疑是巨大的打擊,甚至從定價上,兩者也差距不大:GPT的Plus套餐每月20美金即可使用ChatGPT Agent,而Manus的基礎計劃是每月19美金。底線重點:ChatGPT Agent:是能夠執行複雜、多工具任務的統一AI Agent。它整合了對文字瀏覽器、GUI 瀏覽器、終端和圖像生成工具的存取。支援與用戶進行互動式、多輪對話,允許打斷和澄清。安全防護升級:加強對網頁「惡意提示」攻擊的防禦;設定高風險任務自動拒絕;生物/化學風險也按最高等級安全堆疊處理。它在多個現實世界和基準任務中取得了最先進的結果。ChatGPT Agent概覽功能很像ManusChatGPT Agent的核心是一個統一的代理系統(unified agentic system),整合並擴展了OpenAI 早期研究專案"Operator"(專注於網站互動)和"Deep Research"(專注於資訊綜合)的能力。這使得ChatGPT Agent 能夠在單一的對話流中,無縫地從推理思考切換到執行具體動作。虛擬電腦環境:ChatGPT Agent在一個為其特設的虛擬電腦上執行所有任務。這個環境是沙盒化的,確保了操作的安全性。它能夠在該環境中保存任務的上下文,即使用戶中途打斷或改變指令,也能從斷點繼續,而不會丟失進度。智慧工具箱:為了完成複雜工作流程,Agent 配備了四種工具,並能根據任務需求自動選擇最適合的工具:視覺化瀏覽器(Visual Browser): 用於與圖形使用者介面進行交互,例如點擊按鈕、填寫表單和瀏覽為人類設計的網站。文字瀏覽器(Text-based Browser): 用於需要高效推理和處理大量文字的網路查詢。終端機(Terminal): 允許Agent 運行程式碼、下載和處理文件。API 存取: 可以直接呼叫API 來獲取訊息,例如透過連接器存取Google Drive、Gmail 和GitHub 等應用程式的資料。新模型驅動:ChatGPTAgent由一個專門為其開發的新模型驅動。這個模型透過強化學習(reinforcement learning) 的方法,在需要使用多種工具的複雜任務上進行了專門訓練,從而學會瞭如何在不同工具之間流暢切換並協同工作。它有以下特性:自主任務執行: 使用者可以用自然語言下達指令,例如“分析我的日曆,並根據最近的新聞為我簡報即將到來的客戶會議”,Agent 能夠自主規劃並執行系列操作,如瀏覽網站、篩選資訊、運行程式碼分析,並最終產生可編輯的幻燈片或電子表格等成果。協作與互動性:它會在需要時主動詢問更多細節以完成目標。使用者可以隨時中斷、重定向任務或完全接管瀏覽器的控制權。安全性與權限控制: 安全性是其設計的核心部分。在執行購買、提交表單、發送郵件或處理個人資訊等具有實際影響的關鍵操作之前,Agent 會明確請求使用者許可。同時,它被禁止執行如金融轉帳或提供法律建議等高風險任務。 OpenAI 也內建了針對「提示注入」等惡意攻擊的防護措施。多項基準測試跑分“破紀錄”最難的HLE 達到41.6%(with tool), 高於剛發表的Grok4(with tool)41.0%。在測量廣域知識與專家級提問的Humanity's Last Exam 上,單次作答準確率達41.6%;採用並行八路推理並選取置信度最高答案後可提升到44.4%。在極難的FrontierMath 數學基準上,借助終端運行程式碼後準確率提升至27.4%。在針對真實知識工作任務的內部評測中,ChatGPT 代理人在約半數案例裡已與人類持平或更佳;在現實資料科學任務DSBench 上,其分析與建模準確率分別達到89.9% 與85.5%,遠超過人類平均值。它對電子表格的直接編輯能力也領先:在SpreadsheetBench 中拿到45.5%,超過 Copilot in Excel 的20%。此外,它在BrowseComp、WebArena 等瀏覽評測裡均刷新了SOTA。(圖:評測方法:SpreadsheetBench的作者在Windows 環境下使用Microsoft Excel 對電子表格進行評估。我們則在OSX 環境中使用LibreOffice,這可能導致評分出現輕微差異。例如,作者報告GPT‑4o 在整體Hard 限制上的結果為15.02%,而我們得到13.38% 在整體Hard 限制上的結果為15.02%,而我們得到了13.912題目根據ChatGPT Agent自己做的PPT,在做PPT的能力上和上網衝浪能力上,Agent的能力都相比純粹的基礎模型有較明顯的提升。但離人類還頗有距離。不是期貨,今日可用自今日起,Pro 用戶可以馬上使用,Plus 與Team 用戶將在數日內陸續開通;Enterprise 與Education 版本將於數周後接入。Pro 每月可用400 則訊息,其他付費用戶每月額度為40 條,可透過彈性的按量計費追加。實際使用非常簡單:在任何對話中切到「代理模式”,描述目標,例如深入研究、製作演示或報銷。螢幕左側即時顯示它的操作流程;若需要登錄,系統會切換到「接管模式」安全輸入憑證。使用者也可以把完成的任務設為周期性執行,例如每周一自動產生指標報告。奧特曼親自提示風險:Agent很強大,也很危險值得注意的是,奧特曼在發布會之後,立刻發了一條長貼,提示使用ChatGPT Agent的風險。在「強調」過ChatGPT Agent處理複雜任務的強大能力後,特別鄭重地提示了產品的風險,並強調:我們尚不清楚具體會造成什麼影響,但不法分子可能會試圖「誘騙」用戶的AI 代理提供不該提供的私人資訊並採取不該採取的行動,而這其中的方式我們無法預測。模型可能會接觸使用者的敏感數據,或遭遇網頁中的惡意「提示注入」攻擊。為此,他們沿用Operator 期間的嚴格控制,並新增多項防護:關鍵動作前必須先得到使用者明確授權;部分高風險任務(如發送郵件)啟用「監督模式」要求使用者全程監控;碰到銀行轉帳等高風險指令會主動拒絕;使用者可一鍵清除瀏覽資料並登出全部會話,或在不需連網時停用連接器。在生物與化學安全方面,OpenAI根據Preparedness Framework 將該模型按高風險級別處理,上線了最全面的安全措施,並與政府、學界及安全機構合作開展紅隊測試與威脅建模,同時啟動漏洞賞金計劃,以便儘早發現並修補潛在問題。ChatGPT Agent夠遙遙領先嗎?ChatGPT Agent最大的創新在於首次在模型中直接整合了完整的虛擬機器環境,使用者可以即時觀察AI的操作過程,這是其它模型產品不具備的。但是,各主流模型公司都在「Agent即模型,模型即Agent」的路上越走越遠。例如,在coding agent能力上幾乎封神的Claude。眾多需要藉用底層模型搭建的Agent產品,甚至離開了Claude,就什麼也不是。剛上線的Kimi K2採用開源的混合專家模型架構,定位就為Agentic Intelligence,且價格僅有Claude 4的1/6左右。上線之後,token的採用量排名持續飆升。但從「模型即Agent」這條路來說,OpenAI並不能算是遙遙領先,僅僅能說邁出了一小步。OpenAI在官方文件中也特別謙虛地表示:需要注意的是,功能仍處早期:例如投影片產生功能現為beta,格式與美觀度仍待提升,現階段主要優化資訊結構與元素可編輯性;未來我們將繼續訓練新版本,以產生更精緻的文件。總的來說,隨著持續迭代,ChatGPT 代理的效率、深度和多樣性都會不斷提升,我們也會逐步調優用戶監督的力度,在易用與安全之間取得更好平衡。看著自家產品的展示,Sam Altman不禁又開始感嘆,「我感受到了AGI」。然而,在貼文後面還是有用戶留言問,說好的GPT-5呢?(騰訊科技)
Manus跑路了嗎?
Manus,真的從中國撤了?!4個月前一夜躥紅起飛的AI Agent產品Manus,剛被曝出背後公司一舉裁掉中國七成團隊。事實上,Manus總部已在5月搬到了新加坡,中國員工何去何從?現在答案終於落定,一言以蔽之:大刀闊斧地裁員。Manus中國團隊約120人,僅有核心研發團隊40人遷往新加坡,其餘約80名非核心員工被裁。據稱裁員補償待遇優厚,被裁人員能拿到N+3或2N的賠償。事實上,Manus的離開似乎十分絲滑和平靜。現在再來到Manus北京辦公室曾經所在地epark海淀花園路社區,園區人員並不知道這家公司撤離的具體時間,園區也不同於3月爆火時媒體往來與駐紮,一片喧囂模樣。當量子位問及相關事宜時,聯合創始人兼CEO肖弘以他昨日午後在即刻的一篇帖子作為回覆。其中寫道:想要在全球化的市場裡做好產品,有很多不是來自業務本身和使用者價值本身的煩惱。但這一切是值得的。一方面因為旅程本身就有很多開心的、讓自己和團隊成長的事情。另外一方面,如果最後有不錯的結果,證明作為中國出生的創始人,也能在新的環境下做好全球化的產品,那就太好了!Manus一夜躥紅後這125天,也真沒少幹活就大規模裁員傳聞,Manus官方對外給出的回覆是,“基於公司自身經營效率考量”,因此“決定對部分業務團隊進行調整”。不少人將這一回應解讀為Manus在華潰敗,以至於消息傳出後很多人表示疑惑,第一反應是:這麼快?不是還火得一塌糊塗嗎?是的,Manus火得一塌糊塗,而且從發佈起一直火到今天——天價邀請碼給予了大眾對這家公司最深刻的記憶烙印,以至於其它新聞關注者寥寥。其實梳理後不難發現,發佈至今的125天以來,Manus都持續在對外釋放好消息。3月,關鍵詞:一炮而紅3月6日凌晨,Manus突然上線,名稱取自拉丁語 “Mens et Manus”,意為大腦+雙手。它的定義為全球首款通用AI Agent產品,強調其獨立思考+任務執行能力。發佈3日內,等待名單突破200萬,官網因流量過大當機;發佈當周即超越OpenAI的DeepResearch等,登上GAIA基準測試榜首。由於採用邀請制內測,一碼難求,市場一度哄抬到10萬元/碼。部分內測人士開始發佈實測反饋,“套殼”“無護城河”等輿論開始發酵。3月10日,Manus聯合創始人兼首席科學家季逸超直接表示產品“基於阿里千問大模型及Claude等模型微調而成”,並強調這是自主整合框架,不懼“套殼”爭議。同日,也就是產品發佈後第五天,Manus官方宣佈與阿里通義千問團隊達成合作。一是宣佈計畫基於通義開源模型實現國產化替代。同時宣佈的還有接入QwQ-32B模型降低推理成本。當時,內測使用者日均呼叫成本已經來到2美元水平線。此後,Manus官網逐漸完全漢化。3月18日,聯合創始人兼首席科學家季逸超發推文透露,Manus這樣的Agent環境下,每個使用者的平均token消耗量是聊天機器人的1500倍,“這僅僅是個開始”。3月28日起,Manus開始推出付費訂閱計畫,Starter檔39美元/月,Pro檔199美元/月。3月底,Manus在舊金山舉辦了第一次線下使用者聚會。4月,關鍵詞:B輪融資整個4月上旬,Manus顯得比較沉默,但朋友圈裡可以看到創始團隊全球飛來飛去參加各種活動、論壇與交流會的身影。不過到4月下旬就有好幾個比較重磅的新消息傳出。一個是4月16日,Manus整合到了Google Drive,使用者點選上傳檔案按鈕,就能連接Google Drive開始使用。另一個是傳出了融資進展。彭博社稱Manus完成7500萬美元(約合人民幣5.5億元)B輪融資。領投的Benchmark是一家美國老牌VC,以少而精、長期陪跑著稱,曾投資過eBay、Twitter、Instagram、Uber、Snapchat,2024年募資後重點投向AI領域。此時,Manus估值已經較上一輪融資時翻了5倍,來到5億美元(約合人民幣36.5億元)。而此輪資金的主要流向之一,就是“主要用於擴張美國、日本、中東等海外市場”。5月,關鍵詞:開放註冊5月12日,翹首以盼的等待者們終於迎來了Manus向所有使用者開放。所有新使用者獲1000積分獎勵,此後每日免費贈送300積分。開放首日,Manus註冊量即破100萬。5月14日,市場出現該公司估值飆升至15億美元的傳聞,很快遭合夥人張濤否認。5月15日,關聯公司北京紅色蝴蝶科技有限公司發生工商變更,Manus聯合創始人兼CEO肖弘新任該公司法定代表人、經理、董事職務,同時該公司增資至2000萬美元。5月16日,Manus趁熱打鐵上線圖像生成功能。這是一個綜合性AI Agent圖像生成功能。不僅能生成圖像,還能理解使用者意圖,規劃解決方案,並知道如何有效利用圖像生成工具及其他工具來完成任務。緊接著,5月21日,Manus宣佈了與微軟的合作。與微軟/Azure AI Foundry之間協同,以期推動快速擴展並解鎖新的企業應用場景。6月,關鍵詞:總部遷徙6月4日,Manus針對付費使用者開放了原生AI視訊生成服務,強調輸出有故事性的視訊內容,單次生成片段約為5秒。6月8日,官推宣佈上線PPT功能。直到這個時候,一切看上去還是有條不紊,風平浪靜,其實暗流早已湧動——6月13日發佈的官網博文顯示,Manus在新加坡招聘AI工程師、資料科學家、軟體開發經理等崗位,月薪8000美元起步。同時,加州、東京也設有辦公室。6月18日舉辦的新加坡Super AI活動上,產品合夥人張濤表示:公司總部已經遷至新加坡。6月26日,Manus官網發表文章,披露:在過去三個月中,Manus通過架構增強和基礎設施最佳化,將速度提高了2倍,成本降低了5倍。7月,關鍵詞:中國裁員7月8日,網路平台傳出消息,稱Manus將裁掉中國約80位員工,佔中國員工總數七成左右。針對此消息,Manus方面回應澎湃新聞稱:基於公司自身經營效率考量,我們決定對部分業務團隊進行調整。公司將繼續專注核心業務發展,提升整體營運效率。看起來真走了,但說實話也不意外Manus真的走了嗎?先是張濤公眾場合公開表示總部已搬遷,後是裁員消息得到官方證實。雖然官方並沒有正式發佈任何“總部遷移”公告,但從各種訊號來看,Manus已經悄然完成了轉場。不過目前的工商資料顯示,截至推文發出,Manus背後的北京蝴蝶效應科技有限公司(後簡稱蝴蝶效應)、北京蝴蝶效應科技有限公司武漢分公司還處於存續狀態。但是日曆往前翻,Manus母公司蝴蝶效應在新加坡的實體Butterfly Effect Pte. Ltd.,早在Manus產品上線之前——2023年8月就完成註冊,並由開曼群島註冊的母公司全資控股。簡單概括結構:開曼控股公司→新加坡實體Butterfly Effect Pte. Ltd.→Manus產品團隊。這是一套典型的出海架構,用於便利海外融資、營運和拓展海外市場。所以Manus從一開始,就心放全球了。但中國市場該產品依舊線上,訂閱服務仍可購買,使用者並未被斷供。只不過約等於Manus終於明目張膽地表示,今後的資源和主力轉向了海外,這是一種典型的重心轉移。普通人或許沒有探究其背後各種公司註冊的運作,但一定能從最初的產品發佈視訊中發現線索。這家公司針對Manus推出的首個宣傳視訊,這個後來被無數Agent產品發佈時競相效仿的宣傳視訊,從頭到尾都在用英文介紹這款橫空出世的產品。說白了,Manus爆火4個月後的核心力量大遷徙,主攻海外,早就在與公眾見面的第一天就埋下了草蛇灰線。所以才說這種選擇毫不意外。一方面,Manus做的是通用AI Agent,驗證了標準化工具整合的可行性,這種與MCP類似理念的生態在海外更成熟。不論是模型的API可接入性,還是開發者生態、企業客戶付費意願,都更適合他們當前的產品形態。另一方面,中國使用者對ToC軟體的付費習慣依然較弱。那怕是AI應用,大部分仍傾向於“體驗為主”,使用者粘度不高。量子位智庫統計資料顯示,剛剛過去的6月,DeepSeek在Web端的中國總訪問量市場總佔比也持續下降至39%。名聲最盛且免費使用的DeepSeek尚且遭遇這樣的斷崖式使用者流失,更別提任何一個訂閱制的AI產品了。中國當下的環境,想要維護高粘性使用者群體,建立穩定訂閱,真的並不容易。更何況你也看到了,Manus一開始的野心就是全球市場,應該也從未有一刻想過放棄。選擇從一個更利於融資、開發、落地的地方出發,是現實驅動下的策略選擇。就像合夥人張濤昨日在即刻的發言:選擇正確的激勵函數,比函數值本身更為重要究其本質,Manus和所有做出海業務的公司沒什麼兩樣。只是這家由中國團隊攢局,並在全球打出一片天的AI Agent公司,在破圈式爆火125天後,間接宣判了自己的下一步:業務重心、核心人員和公司總部,從今以後一起“物理”出海去了。說白了,Manus現在優先賺外國人的錢,做給海外使用者用的工具,算不上潰敗,也不是跑路,更多是一種選擇。不過話說回來了,面向出海後就不捲了嗎?矽谷那邊最新的風投消息是,Agent創業賽道里,擠滿了中國人……哈哈哈哈。 (量子位)
字節、百度湧入8500億藍海,Manus式的創業機會還有嗎?
「奔向AGI」欄目聚焦AI大模型、AI agent、AI應用、晶片、機器人等前沿、熱門的AI技術和商業創新。近期,OpenAI創始人山姆·阿爾特曼表示,2025年將是AI Agent大規模應用之年。“Agent作為‘數字員工’,將為各行業顯著節省時間,提升效率,創造可觀的商業價值。”他說。簡單而言,AI Agent可替人執行查資料、訂機票、做PPT、寫程式碼等任務,是能自主思考,替人幹活的“數字管家”。今年,OpenAI一口氣推出兩款AI Agent產品:Operator可自主操作瀏覽器完成複雜任務,例如線上訂餐、購物和訂票;Deep Research能在半小時之內輸出金融、科學、政策等領域的深度調研報告。它還花30億美元收購了程式設計AI Agent公司Windsurf。AI Agent也在中國火熱。Manus內測碼曾被黃牛炒至上千元,而後它又獲得矽谷VC領投的7500萬美元投資。字節跳動、阿里巴巴等網際網路大廠紛紛下場,Flowith、Lovart等AI Agent創業項目也紛紛湧現。華經產業研究院顯示,中國AI Agent市場規模將於2028年超過8500億元,年複合增長73%。在這瘋狂增長的藍海市場,有投資人認為創業機會在於垂直細分領域的AI Agent,而非定位於寬泛toC場景的通用AI Agent,矛頭直指定位於通用AI Agent的Manus。金沙江創投創始合夥人朱嘯虎在談及GoogleAI大模型正把產品全面AI Agent化時表示:“許多通用AI Agent的創業項目會被打穿,創業一定要遠離‘通用’概念,聚焦於垂直。”大廠入局通用Agent 創業項目打不過今年以來,AI Agent之風同時在國外和中國颳起。5月,微軟、Google相繼召開大會,AI Agent均成為兩家公司的重點。微軟CEO納德拉在大會上表示:“會讓Agent驅動更多微軟的應用程式。”GoogleCEO皮查伊則表示,Chrome瀏覽器、搜尋及旗下AI大模型Gemini將推出AI Agent模式。在中國,AI Agent也是被追逐的業界熱點。首先推出AI Agent產品的是中國創業公司,這些項目聚焦於泛C通用領域。Manus於3月火爆全網,之後其母公司蝴蝶效應獲得了新一輪融資,由矽谷VC benchmark領投7500萬美元。睿獸分析顯示,公司投後估值為5億美元。圖源:Manus另一款通用Agent產品——Genspark,近期也獲得資本關注。該產品由前小度科技CEO景鯤和CTO朱凱華聯合製作,公司已於去年6月獲得藍馳創投6000萬美元種子輪投資,今年2月又獲得1億美元A輪投資,藍馳創投也是投資方之一,據稱公司投後估值漲到5.3億美元。圖源:Genspark在此之後,多家更大型的公司在4月、5月密集發布了通用Agent產品:字節跳動推出扣子空間,可接入飛書雲文件、電子表格、高德地圖等;百度推出通用Agent產品“心響”,可支援簡歷製作、行程規劃、資料分析等200多種任務;崑崙萬維推出Skywork超級智能體,可按照要求,生成專業文件、Excel表格和PPT。隨著中國大公司紛紛湧入通用Agent賽道,通用類AI Agent的創業項目,被中國投資人看衰。金沙江創投創始合夥人朱嘯虎曾發多條朋友圈,看衰通用場景的AI Agent項目,看好垂直場景的AI Agent商業化潛力。明勢資本合夥人夏令就在播客中表示,距離AI大模型主航道太近的通用Agent創業有較大的失敗風險,相較而言,服務於精準人群的垂直Agent才是創業機會。創業邦從多方瞭解到,在大廠紛紛入局的情況下,通用Agent創業項目的成功機率不被看好。InAI Capital創始人竇玉梅解釋道:“通用Agent會面向規模龐大的普通消費群體,需要更多資源支援,更適合已有算力資源和AI大模型底座的大公司。以崑崙萬維為例,它既是算力基礎設施公司,也是最早一批自研大模型的公司,進入通用類Agent應用賽道可能會具有競爭力。”隨著中國大廠紛紛入局,通用Agent的創業機會將愈發縮小。並且,已有相對成熟通用Agent的創業項目,如蝴蝶效應的Manus,在沒有足夠算力儲備,也未自研大模型的情況下,若沒有持續密集的融資支援,難以在中國市場取得業務突破。目前,Manus和Genspark都把業務拓展重心放到海外市場。歐美使用者有較強的付費意願,對訂閱制接受度較高,可以驗證商業化潛力。Manus就宣稱最新融資的款項將用於拓展服務至美國、日本和中東在內的其它市場。蝴蝶效應和阿里巴巴合作的中文版Manus至今處於開發階段而未公佈。不過,通用Agent領域並非毫無機會。原圈科技CEO韓劍認為,使用頻度低的通用Agent產品,大廠做得更好。但是,如果創業者能找到使用頻度很高的通用場景,產品形成高使用者粘性,依舊有機會。“類似於Plaud Note這一創業產品的思路可供參考。它可吸附於手機背面,具備拾音功能,搭載多種AI大模型,可面向會議、醫療、教學等各類場景,進行轉錄、紀要、腦圖生成等功能。由於使用者體驗很好,累計出貨量已超10萬台。”韓劍說。多家垂直Agent今年已獲億元級融資今年以來,中國已有多起關於垂直Agent的千萬元級和億元級融資事件。2025年2月,Liblib AI獲得來自渶策資本和順為資本共同領投的數億元A+輪投資。它的海外團隊製作的產品Lovart一度爆火。該產品專門面向設計師的工作場景,可一句話生成logo、海報、音樂、動畫、品牌套件等全套品牌視覺體系,質量被認為是專業級。在此之前,明勢資本曾在2024年獨家投資了數億元A輪,天使輪由原始碼資本和高榕創投投資。使用者只需手動輸入一個簡單提示詞,Lovart就能在幾分鐘內生成一整套設計方案,而此前設計師需花一周時間。並且,和通用Agent相比,Lovart生成質量更高,所需時間更短。2025年3月,Shulex獲得盛大資本和北極光創投投資的億元級A輪投資。該公司發佈一款面向跨境電商的客服Agent,Solvea。Solvea可替代人工客服,為跨境電商顧客處理退換貨、物流追蹤、投訴管理等。這是該公司的首次公開融資。根據公司描述,公司已服務百家跨境品牌,並且Solvea在客戶意圖識別和客服問題解決等方面表現較好,且能滿足跨境資料合規要求。除上億元級別的融資外,還有多起數千萬元級融資。這些Agent創業公司主要面向面試招聘、醫療問診、市場行銷等垂類領域。例如,面向製造業場景Agent項目的智用開物在天使輪階段就獲數千萬元投資。“即使大公司具備算力、資本等資源優勢,做通用Agent項目更易成功,但是通用Agent無法獲取眾多垂直場景的工作流和資料資源。一旦某一創業團隊在某垂類領域積累深厚,他們創造出的垂類Agent產品,在相同垂類場景下會更加好用。”未盡研究創始人周健工表示。垂類資源賦能垂類Agent產品,這使得許多深耕垂類領域的SaaS公司,找到了新業務增長契機。“SaaS公司已有客戶基礎,懂客戶需求,在此基礎上研發垂類Agent,它的成功機率會比創立於AIGC時代的垂類Agent公司,要高。”周健工認為。不過,也有業內人士認為過往的SaaS經驗會成為研發垂類Agent的絆腳石。原圈科技是一家垂直於行銷領域的Agent創業公司。創始人韓劍於2017年開始聚焦於數位化行銷的創業,多年以來,公司一直專注於行銷SaaS領域,獲得靖亞資本、海納亞洲、常春藤資本的投資。2024年,韓劍重新建構了一套AI Agent的軟體架構,並計畫用這套架構“吃掉”此前研發多年的行銷SaaS軟體,使得原本的SaaS軟體成為該Agent的工具集。目前公司過半的年營收,就來自於垂類Agent產品的銷售。圖源:原圈科技“今天要做好垂類Agent,最好的選擇是把過去甩在一邊。如果過多思考過去,會讓我猶豫,而這種猶豫在徹底變革的AI時代是有害的。”韓劍說:“客戶案例、客戶資料等過往積累的優勢,都抵不過改變的態度來得關鍵。”垂直Agent終究會被 通用Agent打敗?生成式AI融入人們的工作生活越來越深。2025年第一季度,微軟旗下的AI平台的使用量(Token數量)同比增長5倍,總額超過了100兆。在中國,字節跳動旗下AI平台的使用量(Token數量)從2024年5月日均1200億,增長至2025年3月日均12.7兆,一年不到增長100倍。AI不僅持續融入日常生活,而且計算成本也正快速下降。“AI計算成本每年下降到原來的五分之二左右,並且Agent能力會隨大模型迭代和智能體框架創新而不斷變好。成本下降和性能提升疊加起來,再加上Agent在token消耗上的指數提升,未來Agent賽道的想像空間非常大。”一支菸花創始人皮皮認為。皮皮是一位AI虛擬人創業者。在如此富有想像空間的市場中,垂類Agent所構築的“護城河”,可能在長期會受到通用Agent不斷增強的AI泛化能力的威脅。東吳證券研報認為,雖然垂直Agent憑藉其深度領域知識和定製化能力在短期內具有發展空間,但是通用Agent的泛化浪潮對垂直Agent構成了長期且顯著的威脅。不過,韓劍認為未來並非一定會如此演變。“AI強化學習已是如今AI應用的主流技術範式,通用Agent難以做好某一垂直領域的強化學習,所以它的生成結果比不上垂類Agent。就像目前AI大模型無論通過何種方式訓練,在圍棋領域也無法打敗Alpha Zero,因為Alpha Zero是運用全球頂尖圍棋選手資料,並迭代出一套專門用於圍棋領域的演算法而成的。”周健工則認為,不論通用Agent攻入垂直領域,還是垂直Agent進入通用範疇,都有機會。“通用和垂直的邊界是不斷動態變化的。正如紅杉資本所言,現在使用者需要的是結果,而非工具。但凡能提供最好結果,使用者不會在意這一結果是通用Agent或是垂直Agent做的。” (創業邦)
Manus全面開放註冊,一文詳解AI Agent原理和價值
今年爆火的AI Agent應用Manus在5月13日宣佈全面開放註冊。此前,Manus因嚴格邀請制導致黑市交易火爆,邀請碼曾被炒至 10 萬元。2025年以來,相信大家都能夠明顯感受到AI Agent備受市場的關注。業內普遍認為,2025年將是Agent爆發之年。Gartner預測,到2028年,至少15%的日常工作決策將通過Al Agent完成。 微軟、Google、阿里等科技巨頭紛紛佈局卡位,OpenAI、智譜、Monica等初創公司們也爭相推出各自的“Agent”產品且已嶄露頭角。本文會從這款火爆的AI Agent產品Manus談起,來具體分享關於AI Agent的概念、技術原理、價值、以及未來趨勢。一、Manus是什麼?如何註冊體驗?關於ManusManus是一款由中國團隊Monica.im推出的AI 應用產品。2025年3月推出,被稱為“全球首個通用型AI Agent”。其名稱源自拉丁語“手”(Manus),寓意“思考與行動並重”。它是AI應用產品,不是一個大模型,所以跟DeepSeek不是一回事,所以不要和大模型混淆。這款產品的下功夫的地方主要是在我們上篇文章裡講的「應用層」,基於多智能體(multi-agent)來實現複雜且多變的通用任務處理能力。與ChatGPT、DeepSeek不同,Manus 是一款通用 AI 智能體,Manus擁有更多的技能,能夠自動規劃並一次性組合多種技能,解決一個複雜的應用場景問題的AI智能體。ChatGPT本質上是一個以大模型為主的生成式AI應用,它目前只能解決一些跟內容生成有關的問題,解決不了跟生成無關的問題,包括自動化任務,或者跨平台執行任務,比如部署網站、幫你訂餐等,這些跟生成式AI無關;而Manus AI更像是一個自主規劃並執行任務的機器人,生成式AI只是它的一部分能力,除此之外,它還能能自主執行自動化任務,或者跨端執行任務;而現實的應用場景中,使用者並不是只有AI生成的需求,還有自動化任務相關的需求,這是很多使用者認可它的原因,也就是Manus不僅思考,更能交付結果。它的功能特性體現在:實現 “思考 - 規劃 - 執行” 全流程閉環。例如當你想要AI幫你完成一份某某行業的產業鏈分析報告PPT,ChatGPT可能會幫你生成提綱和每個章節的主要內容梗概,然後你可以自己繪製PPT或者單獨找到一個PPT自動生成的AI工具幫你生成PPT。而Manus則可以自動幫你:1. 規劃:將該指令拆解為“建立Python檔案-爬取資料-生成圖表-創作分析報告-生成PPT”這個過程;2. 執行:完成整個過程所有的任務,自動去對接資料、呼叫PPT工具生成PPT。3. 最終直接將一份完整的PPT奉上。整個過程不需要人工介入。可以解決更多的通用場景問題。你可能會說有些PPT的AI生成工具也可以一句話指令幫我們生成PPT,但是對於Manus,它可以完成各種類型的任務,也就是為什麼它被稱為“通用型AI Agent”。除了生成PPT,它還可以完成圖片視訊生成、報告生成、程式碼編寫和部署、幫你打開某個網站等各個類型的任務。相比之下,ChatGPT等產品,是不能幫我們完成這麼多執行類任務的;相比一些專用的工具,如AI生成圖片、AI生成PPT的應用,我們也只能完成特定類型任務,你無法對他們提出幫你建構一個網站並部署這樣的超綱要求。總體而言,ChatGPT像一個“有頭腦有嘴的對話助手”,Manus更像一個“有頭腦有手有腳的自主打工人”,而且是一個“綜合能力強”的“自主打工人”。有了這款工具,理想的情況下,我們只需要“一句話需求”,就能得到一份“高品質的結果”,不需要我們再次人工調整。是不是聽起來相當的美妙?那麼實際上,這款產品在實際體驗上是否真的能達到這樣的水平?關於這款產品的具體能力測評網上有很多,一些使用者對Manus的高效和智能感到驚豔,但也有使用者則認為它“不成熟、難用”,並未達到預期效果。這款應用目前已經全面開放註冊體驗,大家可以親自體驗一下。下面附上註冊體驗教學,非常簡單。Manus如何註冊體驗1. 訪問Manus AI 官方地址:https://manus.im/注意:此處需要科學上網,如果使用的是國內的網路,會自動跳轉到manus中文網,中文網目前還沒有可用的服務。2.點選右上角的「開始使用」,進入註冊頁面。可以使用信箱進行註冊,或者Google或Apple帳號註冊。我選擇的是Apple帳號,使用Apple帳號註冊時,注意後面不要選擇隱藏信箱地址(我選隱藏時失敗了)。註冊過程最後一步會要求繫結手機號,手機驗證碼驗證通過後,即註冊成功。3.註冊成功後,就可以看到manus的服務首頁面了。註冊後會獲取1000個免費積分+註冊當日的300積分。後續每天會贈送300積分用於執行任務。4.在對話方塊給輸入任務要求,就可以執行了。二、AI Agent的概念和工作原理暢想一下,目前我們在工作中使用電腦時,往往在各個桌面軟體和瀏覽器網站之間穿梭。而當AI Agent與我們的各類辦公工具和企業應用軟體完成深度融合後,我們工作的模式將發生改變:我們不再需要挪動滑鼠“不斷往復的軟體操作”,我們只需要提出我們的需求,AI Agent自動幫我們來“穿梭操作”,我們只需要等待,直接拿到一個符合我們要求的結果。是不是很不錯?這裡提到的關鍵概念就是AI Agent,下面我們就來瞭解一下AI Agent的概念內涵、原理和應用價值和未來潛力。AI Agent是什麼AI Agent(人工智慧體)是能夠感知環境、自主規劃、進行決策和執行動作以實現目標的智能體,具有自主性、互動性、反應性、適應性等基本特徵,其核心驅動力為大語言模型。大致來說,一個智能體應具備類似人類的思考和規劃能力,擁有記憶甚至情感,並具備一定的技能以便與環境、智能體和人類進行互動。智能體所描述的能力範圍邊界,可以大致總結為以下公式:LLM 和 Al Agent 的區別在於:Al Agent 可以獨立思考,並做出行動。關於AI Agent的工作原理,這裡整理了兩個版本,我們先學術,再具象通俗。AI Agent架構智能體的架構我們可以從不同的視角去拆解,下面我們分別從能力視角和系統視角去看。從智能體的能力視角上看,OpenAI 的應用研究主管 Lilian Weng 提出了 Agent = LLM + 規劃 + 記憶 + 工具使用的基礎架構,其中 LLM 扮演了 Agent 的“大腦”,在這個系統中提供推理、規劃等能力。從系統工程視角上看,2024 年 Google 團隊發佈的 Agents 白皮書將AI Agent分為“思考模組”(模型)、“執行模組”(工具)、“流程控制模組”(編排)。模型:是用作 Agent 中用來做核心決策的語言模型(LM)。可以是通用的、多模態的,或根據特定 Agent 架構的需求微調得到的模型。與普通模型不同,Agent 中的模型具備原生邏輯層,內建複雜推理框架。工具:基礎模型在文字和圖像生成方面非常強大,但無法與外部世界聯動極大限制了它們的能力。 工具的出現解決了這一問題,工具層突破語言模型的靜態知識限制,賦予即時資料訪問與現實世界互動能力。例如,結合使用者資訊和獲取天氣資料的 tool,Agent 可以為使用者提供旅行建議。2024年11月25日,Anthropic開源了劃時代的“模型上下文協議”(MCP),MCP解決了資料獲取和功能獲取等API的統一接入問題。編排層:描述一個循環過程:Agent 如何接收資訊,如何進行內部推理,如何使用推理來結果來指導其下一步行動或決策。一般來說,這個循環會持續進行,直到 Agent 達到其目標或觸發停止條件。編排層的複雜性跟 Agent 及其執行的任務直接相關,可能差異很大。 例如,一些編排就是簡單的計算和決策規則,而其他的可能包含鏈式邏輯、額外的機器學習演算法或其他機率推理技術。雖然以上是兩種不同的視角,但是這兩種架構的拆分部分的對應關係如下:AI Agent 的工作原理(通俗版)為了方便大家理解,準備了一個更加通俗的工作原理介紹。簡單來說,AI Agent 就像一個聰明的“任務小管家”,能聽懂你的需求→自己想辦法→找工具幹活→再調整直到完成目標。它的核心由三層協作完成(模型、工具、編排層),配合過程可以理解為三步循環:模型層(大腦)- 決策中心相當於 Agent 的“大腦”,負責理解問題和規劃步驟。 例如,“訂機票”任務中,模型需要判斷:“使用者要飛那?需要我查航班?還是查天氣?”但模型只會“動腦”,和普通人一樣無法徒手查航班或發郵件,必須靠工具。工具層(手腳和感官)- 行動觸手當模型需要行動(例如“查北京天氣”),自動選合適工具→傳送指令→等待工具返回結果。工具類型:查資料工具:像“瀏覽器”,能搜尋即時資訊(如航班時刻)。執行工具:像“手”,可執行指令(如傳送郵件、訂機票)。儲存工具:像“文件庫”,儲存專屬知識(如公司內部資料)。編排層(流程管理員)- 循環督導確保計畫不跑偏,像“監工”一樣循環檢查: 觀察 → 思考下一步 → 呼叫工具 → 再觀察 → 直到目標達成。實際例子🌰:訂機票流程整個過程就像 “人腦思考→用手操作工具→不斷修正” 的自動化版本,最終幫你搞定複雜任務。三、AI Agent的應用價值2024年5月,微軟公司創始人比爾·蓋茲公開表示,AI Agent不僅會改變每個人與電腦互動的方式,還將顛覆軟體行業,帶來從鍵入命令到點選圖示以來,最大的計算革命。Gartner預測,到2028年,至少15%的日常工作決策將通過Al Agent完成。 微軟、Google、阿里等科技巨頭紛紛佈局卡位,OpenAI、智譜、Monica等初創公司們也爭相推出各自的“Agent”產品且已嶄露頭角。目前的主流AI Agent產品目前AI Agent產品可以分類兩類,一類是智能體應用,一類是用於建構智能體的低程式碼平台。通用智能體應用(提供任務執行能力):也就是開篇介紹的Manus這種,直接面向使用者提供一個通用的智能體應用,讓使用者能夠直接發佈指令,智能體完成任務。如:Manus:支援複雜任務處理執行。AutoGPT:自動完成程式碼生成/網路搜尋等跨平台任務通用AI智能體搭建工具(低程式碼平台):這類平台為使用者提供建構AI智能體應用的功能,也就是將上面提到的編排、模型、工具等工作原理能夠通過這個平台進行完整編排和搭建。以下是目前一些市場上主流的產品,這些廠商基於自有的大模型,搭配豐富的API和MCP,並提供工作流編排能力,以及更加便捷的項目示例或範本,讓使用者能夠輕鬆完成一個智能體應用實例的搭建。Agent的未來價值據麥肯錫預測,到2030年AI Agent將推動全球GDP增長1.3兆美元,企業級市場規模達2850億美元。關於未來價值,這裡直接貼上2024 年 Google 團隊發佈的 Agents 白皮書中的總結:“Agent的未來將非常激動人心。 隨著工具變得更加複雜,推理能力得到增強,Agent 將被賦予解決現實生活中越來越複雜的問題的能力。此外,“Agent chaining” 也將是一個戰略性方向, 通過結合 specialized Agents —— 每個 Agent 在其特定領域或任務中表現出色 —— 可以建立一種 “mixture of Agent experts”(混合智能體專家)的方法,能夠在各個行業和問題領域中提供卓越的性能。最後需要說明,複雜的 Agent 架構並不是一蹴而就的,需要持續迭代(iterative approach)。 給定業務場景和需求之後,不斷的實驗和改進是找到解決方案的關鍵。Agents 底層都是基於基座大模型,而後者的生成式性質決定了沒有兩個 Agent 是相同的。 但是,只要利用好這些基座模型,我們可以建立出真正有影響力的應用程式, 這種應用程式極大擴展了語言模型的能力,帶來了真實的現實世界價值。”本文到這裡就結束啦,感謝您能閱讀到此處,希望通過這篇文章能夠讓大家對AI產生一些新的認識和收穫。後面會針對AI的能力邊界和未來與人類的協同模式梳理和分享一些優質的前沿觀點。 (WonderLearner)
Manus vs ChatGPT!比拼任務執行能力,誰更勝一籌?
隨著AI技術的發展,AI Agent(智能體)概念愈發火熱。曾經「一碼難求」的AI Agent平台Manus於近日全面開放註冊。根據官方公告,新註冊用戶每天可免費獲得300積分,並額外一次性獲得1000積分。Manus試圖串聯真實世界工具鏈,但目前執行過程尚未實現穩定高效。為了驗證其實用性和任務完成能力,小K以一名普通用戶的身份,親自註冊了Manus,獲得了1300積分,並對其與生成式AI聊天機器人的代表產品ChatGPT分別進行了兩個真實任務的測試。第一個測試任務是:下載Manus產品負責人張濤在Manus推出前發布的一段名叫“為什麼以前我不愛和人聊Agent”的演講視頻,提取MP3音頻,轉寫成文字,並進一步生成PDF和PPT文件。Manus接收到指令後,開始了一場漫長且曲折的「系統工程之旅」。它不斷在Linux沙箱的終端機中嘗試安裝如BBDown、you-get、FFmpeg、Whisper等工具。其過程中不斷回顯各種技術日誌,看起來更像是一位在調試腳本的工程師。一旦遇到環境異常就重置沙箱,從頭開始全部流程。不過,Manus多次重試安裝語音辨識模組Whisper,但皆未安裝成功,由於耗時過長,小K主動要求Manus跳過轉寫和產生PDF和PPT檔任務,直接輸出MP3音訊。最終,Manus輸出了MP3音頻,並將這份MP3嵌入到一個自動生成的網頁中並部署上線。整個任務耗時約一小時,在未完成文字轉寫、PDF、PPT的情況下積分一次性消耗了1000點。令人感到落差的是,明明可以透過一次簡單的API呼叫快速完成的任務,Manus卻將流程人為拆解成多個步驟,從而製造出「AI很忙」的錯覺。這種「任務複雜化」的做法雖然反映出平台對自動化流程的執著,但也大大拉長了執行時間,耗費了更多資源。而面對相同要求,ChatGPT明確表示無法進行影片下載和轉換,但可以提供內容摘要與簡報提綱。在小K確認後,ChatGPT在1分鐘內就基於影片產生了400字摘要,包括張濤的轉變邏輯、技術演進、Agent產業趨勢的詳盡大綱,並建議了PPT結構設計。在小K進一步提出產生PDF和PPT後,它迅速完成並提供了可直接下載的檔案。雖然ChatGPT不能原始下載視頻,未能輸出MP3音頻,但完成了有組織的、高質量的文字總結和PPT、PDF生成,對資源不可達的場景有自適應應對機制,任務完成度相對Manus更高,用戶體驗更高效、有邏輯,其內容提煉能力極強,適合需要快速摘要的場景,節省了等待與調試的時間。第二個測試任務是:幫我制定3天東京自由行:①產生行程表(含地址/營業時間),②查公共交通路線併計算預估費用,③訂3家拉麵店午餐位,如需驗證碼或付款請停止並提示我。Manus整整花了20多分鐘「逐項收集資料」,包括透過呼叫網路資料來源擷取景點,查詢每個景點的地址與開放時間;計算每日交通路線和預計費用;篩選東京著名拉麵店,並嘗試預約。然而Manus給出的最終結果是,大部分熱門拉麵店(如“饗くろ喜”、“銀座篝”、“一蘭拉麵店”等)均不接受線上預訂,通常需要現場排隊等候,部分店舖或可嘗試電話諮詢,但不能保證預訂成功。建議在午餐時間前提早前往或做好排隊準備。Manus輸出了一份包含3日詳細行程、景點地址和營業時間、交通費用估算的markdown文檔,所有內容自動整理為文件輸出,任務完成度高。不過,內容結構偏「流水帳」式,等待時間冗長。令人沮喪的是,Manus的積分消耗速度也十分驚人。完成第一個任務後,小K只剩300點。雖然評分回贈了100分,也僅稍微緩解損耗。第二個自由行任務提交後,Manus扣除了351點。短短兩次任務,小K帳戶中的積分便已耗盡,未留下任何可持續使用的餘裕。由此看來,Manus每日免費贈送的300點可能還不夠一次完整任務,結合任務實際執行情況來看,Manus性價比並不高。與之相比,ChatGPT快速識別旅行任務並立即產生以下內容:含順序、景點、營業時間的3天行程建議;每天午餐推薦拉麵店,並說明預約方式;公共交通推薦(如Suica卡、一日券);費用估算(2400–3000日元)。最終行程排版美觀,內容結構自然、可讀性強,整個過程高效、連貫、無需等待中間步驟。ChatGPT雖然沒有直接嘗試在線預訂拉麵店,但清楚地列出各拉麵店的預約平台和連結。綜上所述,從這兩個任務的實踐來看,Manus的定位更接近一個“自動執行型AI”,它試圖串聯真實世界中的工具鏈,實現從網頁抓取到工具調用、文件部署的完整流程。它最大的優勢在於“能幹活”,尤其是面對結構明確、步驟清晰的任務鏈時,能主動完成流程性、跨步驟的任務(如下載、轉換、部署、查詢)。然而,它執行過程冗長、穩定性不足、智慧應變能力較弱,且算力資源消耗偏高。而以ChatGPT為代表的生成式AI聊天機器人則使用類人對話的形式,擅長理解模糊需求,快速提供結構清晰、表達得體、可直接使用的內容方案,算力資源消耗較少。當然,隨著AI Agent技術的逐步成熟,Manus這類平台仍有其價值。它讓我們看到未來AI不僅僅是“說話”,而是可以主動執行任務、部署網頁、與工具鏈互動。只是這一切尚未穩定,也未必有效率。如今的AI Agent,更像是一位尚在成長中的熱情滿滿、略顯笨拙的技術實習生,如果未來其能和生成式AI聊天機器人更好地結合——生成式AI聊天機器人提供智能交互,AI Agent負責流程執行,或許才是用戶真正需要的“全能AI”。(財聯社AI daily)